草庐IT

bash - 在 Impala Shell 中重新启动失败的脚本查询

我一直在查看ImpalaShell文档,但没有找到解决此问题的任何内容。我有一个运行Impala查询的bash脚本,然后发送一封包含查询结果的电子邮件。问题是,每隔一段时间查询就会失败;发生这种情况时,脚本的下一行开始运行,并通过电子邮件发送一个空白的CSV文件。是否可以对ImpalaShell脚本本身或框架bash脚本进行修改以解决此问题?我最初的想法是让脚本在CSV文件为空时重新运行查询,但在查询合法地没有产生任何结果的情况下,这会使脚本陷入循环。有什么建议吗?这是脚本现在的模型:#!/bin/bashNOW=$(date+"%F")NAME="001"impala-shell-i

回填 Hive 表的 Bash 命令——运行多个具有更改日期变量的 Hive 命令

试图找出一种方法来回填ds分区Hive表的分区。我知道如何从CLI运行Hive命令,例如$HIVE_HOME/bin/hive-e'selecta.colfromtab1a'我想做的是提供不同DS的.txt文件,并为每个DS运行一个新作业,例如$HIVE_HOME/bin/hive-e'INSERTOVERWRITEPARTITIONds=$DS_VARIABLE_HEREselecta.colfromtab1awhereds=$DS_VARIABLE_HERE'但我不太确定该怎么做我想试试catdate_file.txt|hive-e'queryhere'但我不确定如何将date_f

arrays - 在 bash 中使用数组时变量未正确替换

我想捕获hadoop文件的大小,然后根据它的值进行处理。我写了一些unix脚本,但没有按预期工作。#!/bin/shVAR=$(hadoopfs-ls/user/smike/del|sed1d|awk'{print$NF}'|paste-sd,|sed's/,//g')FVAR=$VARarray1=($FVAR)a=""b=""foriin"${array1[@]}"doecho"$i"#var1=$(hadoopfs-dus/user/smike/del/$i|awk'{print$(NF-1)}')var1=$(hadoopfs-ls/user/smike/del/$i|awk'

bash - 使用 bash 向配置单元脚本发送可变数量的字段

我通过使用bash脚本将csvs移动到HDFS并在其上构建外部Hive表来自动化数据管道。目前,这仅适用于在.hql文件中预定义表格格式的情况。但我希望能够从CSV中读取header并将它们作为参数发送给Hive。所以目前我在文件循环中执行此操作:#bashhive-S-hiveconfVAR1=$target_db-hiveconfVAR2=$filename-hiveconfVAR3=$target_folder/$filename-fcreate_tables.hql发送到这...--hiveCREATEDATABASEIFNOTEXISTS${hiveconf:VAR1};CR

hadoop - bash : syntax error near unexpected token `(' - PIG, CentOs

我正在尝试在pig中执行以下命令7369,SMITH,CLERK,800.00,null,207499,ALLEN,SALESMAN,1600.00,300.00,30脚本emp_bag=LOAD'/home/training/dvs/emp.csv'usingPigStorage(',')AS(eno:int,ename:chararray,job:chararray,sal:int,comm:int,deptno:int);出现以下错误bash:syntaxerrornearunexpectedtoken`('请帮助解决这个问题。 最佳答案

bash - 将配置单元查询输出存储在 shell 脚本变量中

当我尝试通过shell脚本执行以下2个查询时,我无法回显输出:查询:close_val=`hive-e"selectcount(1)fromtst_db.dim_calendarwherecalendar_id=20171102"`close_val=$(hive-S-e"USEcars_dev;selectcount(1)fromdim_calendarwherecalendar_id=20171103")echo$close_val错误:2017-11-0300:55:11,505INFO[main]Configuration.deprecation(Configuration.j

bash - 在 HDFS : How to check if 2 directories have same parent directory

是否有HDFS命令来检查HDFS中的2个目录是否具有共同的父目录。例如:$hadoopfs-ls-R/user/username/data//user/username/data/LIST_1539724717/SUBLIST_1533057294,/user/username/data/LIST_1539724717/SUBLIST_1533873826/UI,/user/username/data/LIST_1539724717/SUBLIST_1533873826/NEWDATA/A,/user/username/data/LIST_1539724717/SUBLIST_1533

hadoop - 通过 Bash Shell 创建 Hive 表错误

谁能告诉我为什么在从bashshell创建分区表时出现错误。[cloudera@localhost~]$hive-e"createtablepeoplecountry(name1string,name2string,salaryint,countrystring)partitionedby(countrystring)rowformatdelimitedcolumnterminatedby'\n'";Logginginitializedusingconfigurationinjar:file:/usr/lib/hive/lib/hive-common-0.10.0-cdh4.7.0.j

bash - 如何在配置单元服务器操作中将动态日期作为参数传递

在Oozie中,我在Hue中使用了Hive操作,同样的操作我使用参数选项来提供日期参数。在这里我想提供动态日期参数,例如昨天和前天。我怎样才能生成这些日期?以及如何作为参数传递。我的HQL是:CREATETABLEIFNOTEXISTStmp_tableasselect*fromemptablewhereday>=${fromdate}andday我的HiveServer操作包含:一种。脚本b.每个日期都有两个参数选项,例如fromdate=,todate=C。为HQL脚本添加了文件选项。我尝试过的:我创建了两个单独的shell脚本来返回日期。其中一个Shell脚本是#!/bin/ba

hadoop - 通过 bash 获取 yarn 资源管理器主机名

我试图通过bash在不同的节点中找到yarn资源管理器主机名。我发现它的唯一方法是键入任何yarn命令和grep/awk来获取它(xxx.xxx.xxx.xxx)。示例:yarnnode-list-allINFOimpl.TimelineClientImpl:Timelineserviceaddress:http://xxx.xxx.xxx.xxx:8188/ws/v1/timeline/16/03/1814:28:16INFOclient.RMProxy:ConnectingtoResourceManageratxxx.xxx.xxx.xxx/10.100.x.y:8050Total